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BREV# D'INVENTION 

CERTIRCAT DUTILITE 

Code de la propriete intellectuelle - Livre VI 

REQUETE EN DEUVRANCE 1/2 



N° 11354*01 



( t Cet imprime est a remplir lisiblement a I'encre noire db stow ncosm 


REMISE 0ES PIECES 
DATE 

UEU 27 JUIL 2000 
13 INPI MARSEILLE 

N° DENREGISTREMENT 

NATIONAL ATTRIBUE PAR L'JNPl 0009682 
DATE 0E 0EPOT ATTRI8UEE a _ JM\T[ 
PARLINPI ^ f JUlL. tUUU 


Q NOM ET ADRESSE DU DEMANDEUR OU DU MANDATAIRE 

A QUI LA CORRESPONDANCE DOIT ETRE ADRESSEE 

■ ■ 

OMMIPAT 

MARCH AND Andre 

24 Place des Martyrs de la Resistance 

13100 A1X EN PROVENCE 

■ ■ 


Vos r6fe>ences pour ce dossier 

(facultatif) 100093 FR 


Confirmation d'un depot par telecopie □ N° attribue par I'INPI a la telecopie 


Q NATURE DE LA DEMANDE 


Cochez I'une des 4 cases sutvantes 


Demande de brevet 




Demande de certificat d'utilite 


□ 


Demande divisionnaire 

Demande de brevet initiate 
ou demande de certificat d'utilite initiale 


□ 

N° Date All 1 
N° Date \ 1 1 1 


Transformation d'une demande de 
brevet europeen Demande de brevet initiale 


□ 

N° Date 1 / / 1 



| TITRE DE L'INVENTION (200 caracteres ou espaces maximum) 

PROCESSEUR DSP A ARCHITECTURE PARALLELE 



□ DECLARATION DE PRIORITY 
OU REQUETE DU BENEFICE DE 
LA DATE DE DEPOT D'UNE 


Pays ou organisation 

Date 1 / / 1 N° 
Pays ou organisation 

Date 1 / / 1 N° 


DEMANDE ANTERIEURE FRANCA IS E 


Pays ou organisation 

Date 1 I I 1 N° 






1 1 S'il y a d'autres priorites, cochez \* case et utilisez 1' imprime "Suite » 


Q DEMANDEUR 


1 1 S'il y a d'autres demandeurs, cochez la case et utilisez Pimprime »Suite» 


Nom ou denomination sociale 


STM1CROELECTRON1CS 


Prenoms 




Forme juridique 


SOCIETE ANONYME 


N° SIREN 


| 3 -4 • 1 -4 o .9 .3 . 8 6 \ 


Code APE-NAF 


f3 -2 -1 - B | 


Adresse 


Rue 


7, Avenue Gal lien i 




Code postal et ville 


94250 GENTILLY CEDEX 


Pays 


FRANCE 


Nationality 


FRANCE 


N° de telephone (facultatif) 




N° de telecopie (jacultatif) 




Adresse electronique (Jacultatif j 
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BREVE#b'INVENTION 

CERTIFICAT D'UTILITE 

REQUETE EN DEUVRANCE 2/2 



Reserve S I'lNPI I 



REMISE OES PIECES 
DATE 

UEU 27 JUIL 2000 
13 INPI MARSEILLE 

N« D'ENREGISTREMENT 



Vos references pour ce dossier : 

(facultatif) 


100093 FR 


□ MANDATAIRE 




Nom 


MARCHAND 


Prenom 


Andre 


Cabinet ou Societe 


OMNI PAT 


N °de pouvoir permanent et/ou 
de lien contractuel 




Adresse 


Rue 


24 Place des Martyrs de la Resistance 


Code postal et ville 


1 

13100 1 A1X EN PROVENCE 


N° de telephone (facultatif) 


04.42.99.06.60. 


N° de telecopie (facultatif) 


04.42.99.06.69. 


Adresse electronique (facultatif) 




Q INVENTEUR (S) 




Les inventeurs sont les demandeurs 


□ Qui 

(~*]Non Dans ce cas fournir une designation d'inventeur(s) separee 


□ RAPPORT DE RECHERCHE 


Uniquement pour une demande de brevet (y compris division et transformation) 


Etablissement i m media t 
ou etablissement d if fere 


E 
□ 


Paiement echelonne de la redevance 


Paiement en trois versements, uniquement pour les personnes physiques 

□Oui 
HNon 


□ REDUCTION DU TAUX 
DES REDEVANCES 


Uniquement pour les personnes physiques 

CHRequise pour la premiere fois pour cette invention Qoimlre un avis de non-imposition) 

C^Requise anterieurement a ce depot (joindre une co/jie de la decision d'culmissivn 
pour cette invention ou indiquersa reference) :. 




Si vous avez utilise I'imprime «Sutte», 
indiquez le nombre de pages jointes 






EQ SIGNATURE DU DEMANDEUR 

OU DU MANDATAIRE ^^-^^ — " 

(Nom et qua lite du signataire) ^^■^^^ 

MARCH AND Andre - CP1 N° 9^*03 ( 
OMNI PAT V 


VISA DE LA PREFECTURE 
OU DE L/INPI 

4^- 



La loi n°78-17 du 6 janvier 1978 relative a I'informatique, aux fichiers et aux libertes s'applique aux reponses fattes a ce formulaire. 
Elle garantit un droit d'acces et de rectification pour les donnees vous concernant aupres de I'lNPI. 
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BREVET D'INVENTION 
CERTIFICAT D'UTILITE 

Code de la propriete intellectuelle - Uvre VI 



N° 11235*02 



DEPARTEMENT DES BREVETS 

26 bis, rue de Saint Petersbourg 
75800 Paris Cede* 08 

Telephone : 01 53 04 53 04 Teiecopie : 01 42 93 59 30 



DESIGNATION D'INVENTEUR(S) Page N° J. . / 3. . 
(Si le demandeur n'est pas I'inventeur ou I'unique inventeur) 



Cet imprime est a remplir lisiblement a I'encre noire 



DB U3W/260899 



Vos references pour ce dossier 

(facuttatij) 


100093 FR 4 


N° D'ENREGISTREMENT NATIONAL 





TITRE DE L f INVENTION (200 caracteres ou espaces maximum) 
PROCESSEUR DSP A ARCHITECTURE PARALLELE 



LE(S) DEMANDEUR(S) : 

MARCHAND Andre 
OMNIPAT 

24, Place des Martyrs de la Resistance 
13 100 AIX EN PROVENCE 



DESIGNE(NT) EN TANT QU'INVENTEUR(S) : (Indiquez en haut a drolte a Page N° S'il y a plus de trois inventeurs, 

utilisez un formulaire identique et numerotez chaque page en indiquant le nombre total de pages). 



Nom 


SANCHES 


Prenoms 


Jose 


Adresse 


Rue 


C/O OMNIPAT 

24 Place des Martyrs de la Resistance 


Code postal et ville 


13 100 | AIX EN PROVENCE 


Societe d'appartenance (facultatij) 




Nom 


CORNERO 


Prenoms 


Marco 


Adresse 


Rue 


C/O OMNIPAT 

24 Place des Martyrs de la Resistance 


Code postal et ville 


13 100 j AIX EN PROVENCE 


Societe d'appartenance (facultatij) 




Nom 


SANTANA 


Prenoms 


Miguel 


Adresse 


Rue 


C/O OMNIPAT 

24 Place des Martyrs de la Resistance 


Code postal et ville 


1 3 1 00 | AIX EN PROVENCE 


Societe d'appartenance (facultatij) 




DATE ET SIGNATURE(S) 
DU (DES) DEMANDEUR(S) 
OU DU MANDATAIRE 
(Nom et qualite du signataire) 

Aix en Provence, le 2 fevrier 2001 
MARCHAND Andre - CPI N° 95 0303 
OMNIPAT 


^^^^^ 



La loi n°78-17 du 6 janvier 1978 relative a rinformatique, aux fichiers et aux Hbertes s'applique aux reponses faites a ce formulaire. 
Elle garantit un droit d'acces et de rectification pour les donnees vous concernant aupres de TINPI. 
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BREVET D INVENTION 

CERTIFICAT D'UTILITE 

Code de la propriete intellectuelle - Livre VI 



N° 11235*02 



DEPARTEMENT DES BREVETS 

26 bis, rue de Saint Petersbourg . 
75800 Paris Cedex 08 

Telephone : 01 53 04 53 04 Telecopie : 01 42 93 59 30 



DESIGNATION D'INVENTEUR(S) Page N° 2. . / 3. . 
(Si le demandeur n'est pas I'inventeur ou I'unique inventeur) 



Cet imprime est a remplir lisiblement a I'encre noire 



DB 113W/2S0899 



Vos references pour ce dossier 

(facultatif) 


100093 FR * 


N° D'ENREGISXREMENT NATIONAL 





TITRE DE L'lNVENTION (200 caracteres ou espaces maximum) 

PROCESSEUR DSP A ARCHITECTURE PARALLELE 



L£(S) DEMANDEUR(S) : 

MARCHAND Andre 
OMNIPAT 

24, Place des Martyrs de la Resistance 
13100 AIX EN PROVENCE 



DESIGN E(NT) EN TANT QU'INVENTEUR(S) : (Indiquez en haut a drorte oPage N° 1/Xo S'il y a plus de trois inventeurs, 
utilisez un formulaire identique et numerotez chaque page en indiquant le nombre total de pages). 


Nom 


GU1LLAUME 


Prenoms 


Philippe 


Adresse 


Rue 


C/O OMNIPAT 

24 Place des Martyrs de la Resistance 


Code postal et ville 


13100 | AIX EN PROVENCE 


Societe d'appartenance (facultatif) 




Nom 


DAVEAU 


Prenoms 


Jean-Marc 


Adresse 


Rue 


C/O OMNIPAT 

24 Place des Martyrs de la Resistance 


Code postal et ville 


1 3 100 AIX EN PROVENCE 


Societe d'appartenance (facultatif) 




Nom 


LEPLEY 


Prenoms 


Thierry 


Adresse 


Rue 


C/O OMNIPAT 

24 Place des Martyrs de la Resistance 


Code postal et ville 


13 100 | AIX EN PROVENCE 


Societe d'appartenance (facultatif) 





DATE ET SIGNATURE(S) 
DU (DES) DEMANDEUR(S) 
OU DU MANDATAIRE 
(Nom et qualhte du signataire) 

Aix en Provence, le 2 fevrier 2001 
MARCHAND Andre - CPI N° 95 0303 
OMNIPAT 



La loi n°78-17 du 6 janvier 1978 relative a rinformatique, aux fichiers et aux libertes s'applique aux reponses faites a ce formulaire. 
Elle garantit un droit d'acces et de rectification pour les donnees vous concemant aupres de TIN PI. 
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BREVET D'INVENTION 

CERTIFICAT D'UTILITE 

Code de la propriete intellectuelle - Livre VI 



N° 11235*02 



DEPARTEMENT DES BREVETS 

26 bis, rue de Saint Petersbourg 
758O0 Paris Cedex 08 

Telephone : 01 53 04 53 04 Telecopie : 01 42 93 59 30 



DESIGNATION D'INVENTEUR{S) Page N° 3. . / 3. . 
(Si le demandeur n'est pas I'inventeur ou I'unique inventeur) 



Cet imprime est a remplir lisiblement a I'encre noire 



DB 113 W/26C899 



Vos references pour ce dossier 

(facultatij) 


100093 FR ' 


N° D'ENREGISTREMENT NATIONAL 





TITRE DE L' INVENTION (200 caracteres ou espaces maximum) 

PROCESSEUR DSP A ARCHITECTURE PARAJLLELE 



LE(S) DEMANDEUR(S) : 

MARCHAND Andre 
OMNIPAT 

24, Place des Martyrs de la Resistance 
13 100 AIX EN PROVENCE 



DESIGNE(NT) EN TANT QUiNVENTEUR(S) : (Indiquez en haut a droite aPage N° 1/1d S'il y a plus de trois inventeurs, 
utilisez un formulaire identique et nume>otez chaque page en indiquant le nombre total de pages). 



Nom 


PAULIN 


Prenoms 


Pierre 


Adresse 


Rue 


C/O OMNIPAT 

24 Place des Martyrs de la Resistance 




Code postal et vtile 


13100 


| AIX EN PROVENCE 


Societe d'appartenance (facultatij) 




Nom 


HARRAND 


Prenoms 


Michel 


Adresse 


Rue 


C/O OMNIPAT 

24 Place des Martyrs de la Resistance 




Code postal et ville 


13100 


| AIX EN PROVENCE 


Societe d'appartenance (facultatij) 




Nom 




Prenoms 




Adresse 


Rue 


C/O OMNIPAT 

24 Place des Martyrs de la Resistance 




Code postal et ville 


13100 


AIX EN PROVENCE 


Societe d'appartenance (facultatij) 




DATE ET SIGNATURE(S) 
DU (DES) DEMANDEUR(S) 
OU DU MANDATAIRE 
(Nom et qualite du signataire) 

Aix en Provence, le 2 fevrier 2001 
MARCHAND Andre - CPI N° 95 0303 
OMNIPAT C_ 







La loi n°78-17 du 6 jarwier 1978 relative a Tinformatique, aux fichiers et aux libertes s'applique aux reponses faites a ce formulaire. 
Elle garantit un droit d'acces et de rectification pour les donnees vous concernant aupres de HNP1. 
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PROCESSEUR DSP A ARCHITECTURE PARALLELE 

La presente invention concerne les processeurs de 
traitement du signal numerique, ou processeur DSP 
("Digital Signal Processors"). 

f La presente invention concerne plus 

5 particulierement les processeurs DSP a architecture 
parallele, ou processeurs VLIW ("Very Large Instruction 
Word" ) . 

Comme cela est bien connu de l'homme de l'art, les 
processeurs de type VLIW sont des processeurs herites des 

10 processeurs RISC qui se distinguent des processeurs DSP 
convent ionne Is par le fait qu'ils comprennent plusieurs 
unites d' execution agencees en parallele. Chaque unite 
d' execution est 1 ' equivalent d'un coeur de processeur RISC 
(Reduced Instruction Set Computer) et execute des codes 

15 instruction de format reduit, generalement de 16 bits, en 
exploitant les ressources offertes par une banque de 
registres. Chaque unite d' execution pouvant executer un 
code instruction simultanement aux autres unites 
d' execution, les processeurs VLIW sont done capables 

20 d 1 executer simultanement une instruction large comprenant 
plusieurs codes "equivalents" RISC en parallele. 

Pour fixer les idees, la figure 1 represente 
schematiquement la structure classique d'un processeur 10 
de type * VLIW, dont les elements essentiels sont. 

25 representes sous forme de blocs. Le processeur 10 
comprend une memoire programme PMEM, une memoire de 
donnees 12, un registre d • instructions IR agence a la 
sortie de la memoire PMEM, un decodeur d ' instructions 
IDEC agence a la sortie du registre IR, une banque de 

30 registres RBANK, prevue notamment pour 1' execution de 
codes instruction de type RISC, des unites d' execution 
EU0 a EU3 , ainsi qu'un circuit BMC formant 1 ' interface 




entre les sorties des unites d' execution UE1-EU3 et les 
entrees/sorties de la memoire de donnees DMEM . Les unites 
d' execution, ici quatre unites EUO, EU1, EU2 , EU3 , sont 
agencees en parallele pour assurer le traitement 
5 simultane de quatre codes instruction lus simultanement 
dans la memoire PMEM, formant ensemble une instruction 
large. La nature des unites d' execution peut varier en 
fonction de 1 1 application a laquelle le processeur est 
destine. Les unites d' execution comprennent par exemple 

10 une unite ALU (unite arithmetique et logique) , une unite 
MAC (multiplication/adition) , une unite CU (unite de 
controle, gerant le compteur ordinal PC et les 
branchements) et une unite CO- PRO (coprocesseur) pour 
effectuer certains calculs specif iques a 1 ' application 

15 visee. 

Un tel processeur est ainsi capable d' assurer 
1 'execution d ' instructions larges constitutes ici au 
maximum par quatre codes. A chaque nouveau cycle 
d'horloge H, le compteur ordinal PC ("Program Counter") 

20 du processeur est augmente d'un increment n qui est egal 
a 1, sauf en cas de saut ou de branchement , et les 
registres d 1 instructions IR0-IR3 regoivent simultanement 
en parallele quatre nouveaux codes destines a etre 
executes par les unites EU0-EU3. 

25 L 1 architecture d'un tel processeur 10 se distingue 

ainsi d'un processeur RISC conventionnel par son 
parallelisme, qui se retrouve dans tous les etages de 
traitement des instructions. Toutefois, les possibilites 
offertes par ce parallelisme sont rarement exploitees au 

30 maximum et les programmes compiles stockes dans la 
memoire programme PMEM comprennent generalement un nombre 
elevee de codes de non-operation, ou codes "NOP" ("No 
Operation"). En effet, la transformation d'un programme 
ecrit en langage de haut niveau, par exemple en langage 

35 C/C++ , en une suite de codes de type RISC regroupes en 
paquets est effectuee de fagon automatique par un 
programme de compilation qui connait la structure du 




processeur et essaie de former des paquets ayant la plus 
grande taille possible (comprenant quatre codes au 
maximum dans 1 1 exemple de processeur decrit) afin 
d' exploiter au maximum le parallelisme du processeur. 
5 Cette optimisation est faite en tenant compte des 
conflits entre les codes, de la disponibilite des unites 
d' execution et des dependances de donnees lors de 
1* execution pipeline des codes. Ainsi, par exemple, deux 
codes destines a etre executes par la meme unite 

10 d' execution ne peuvent etre parallelises dans le meme 
paquet . Egalement, un code utilisant une operande qui est 
le resultat d'une operation visee par un autre code ne 
peut etre execute tant que le code dont il depend n'est 
pas lui-meme execute. 

15 A titre d' exemple, considerons la sequence de 

programme suivante : 



/p cO 


/p cl 


p c2 


/p c3 


p C4 


p c5 


p c6 


/p c7 


p C8 


p c9 



qui comprend des codes instruction cO a c9 comportant 
20 chacun un bit de parallelisme /p ou p. Les codes 
instruction, appeles "syllabes" dans le langage de 
1 ■ homme de 1 ' art , sont regroupes en "paquets " ( "bundle " ) 
pour former des instructions larges. La separation des 
instructions (paquets) au sein d'un programme est 
25 effectuee au moyen des bits de parallelisme "p M affectes 
a chacun des codes. Les deux valeurs possibles n /p" ou 
"p" d'un bit de parallelisme, par exemple 0 et 1, 
permettent de savoir si un code appartient ou non a une 
nouvelle instruction. Plus, particulierement , un code 
30 precede d'un bit de parallelisme "p" (par exemple 1) 
appartient a la meme instruction que le code precedent, 
tandis qu'un code precede d'un bit de parallelisme " /p" 
(par exemple 0) appartient par convention a un nouveau 
paquet . 




Dans la sequence de programme mentionnee ci-dessus, 
les bits de parallelisme permettent ainsi de distinguer 
quatre instructions larges INST1 a INST4 : 
INST1 = cO 
5 INST2 = cl c2 

INST3 = c3 c4 c5 c6 
INST4 = c7 c8 C9 

Pour pouvoir etre executees par le processeur 10, 
ces instructions INST1 a INST4 sont enregistrees dans la 
10 memoire programme PMEM du processeur comme represents en 
figure 1 et decrit par le tableau 1 ci-apres : 



Tableau 1 



/p cO 


NOP 


NOP 


NOP 


/p cl 


NOP 


NOP 


NOP 


/p c3 


p C4 


p c5 


p c6 


/p c7 


p c8 


p c9 


NOP 



15 En consequence, les compilateurs pour processeurs 

VLIW classiques generent un grand nombre de codes de non- 
operation qui ont pour but de maintenir certaines unites 
d' execution inactives pendant que d'autres executent des 
codes. II en resulte un encombrement inutile de la 

20 memoire programme, qui peut representer en pratique entre 
20% et 70% de 1 ' espace memoire selon l'efficacite du 
compilateur et 1' adequation entre le programme a compiler 
et les ressources offertes par le processeur. Cet 
encombrement de 1 1 espace memoire par des codes NOP, qui 

25 est considerable au regard des codes instruction 
reellement necessaires a 1' execution des programmes, 
augmente la surface de la memoire PMEM pour une 
application donnee, done entraine une baisse de 
performance (memoire plus lente avec la taille qui 

30 augmente) , un surcroit de consommation (lignes de mots et 
lignes de bits plus longues dans le plan memoire) et de 
cout (surface de silicium) . 



La presente invention vise a pallier cet 
inconvenient . 

Plus particulierement , la presente invention vise 
un processeur de type VLIW qui puisse recevoir dans sa 
memoire programme des paquets de codes ne comportant pas 
de codes de non-operation. 

Cet object if est atteint par la prevision d'un 
processeur de traitement du signal prevu pour executer 
des instructions de taille variable pouvant comprendre 
jusqu'a N codes instruction elementaires , le processeur 
comprenant une memoire programme comprenant I bancs 
memoire en parallele adressables individuellement , I 
etant au moins egal a N, dans lesquels les codes d'un 
programme sont enregistres de fagon entrelacee a raison 
d'un code par banc et par adresse appliquee au banc, des 
moyens de lecture de la memoire programme agences pour 
lire un code dans chacun des I bancs memoire au cours 
d'un cycle de lecture d'une instruction, un cycle de 
lecture d'une instruction dans la memoire programme 
comprenant la lecture d'une suite de codes comprenant le 
ou les codes de 1 * instruction a lire et pouvant egalement 
comprendre, quand le nombre de codes de 1 ■ instruction lue 
est inferieur a I, des codes appartenant a une 
instruction suivante. 

Selon un mode de realisation, les moyens de lecture 
comprennent des moyens pour appliquer aux bancs memoire 
des adresses individuelles generees a partir d'une valeur 
collective de compteur ordinal, qui est incrementee, 
avant le commencement d'un cycle de lecture d'une 
instruction, d'une valeur egale au nombre de codes que 
comprend 1 ' instruction precedente. 

Selon un mode de realisation, les . moyens pour 
appliquer des adresses sont agences pour appliquer a 
chacun des bancs memoire une adresse de lecture 
individuelle egale a PO ou PO+1, PO etant le quotient de 
la division par I de la valeur du compteur ordinal. 



Selon un mode de realisation, les moyens pour 
appliquer des adresses sont agences pour appliquer a un 
banc memoire de rang i une. adresse egale a PO quand i est 
strictement super ieur a R # ou appliquer a un banc memoire 
de rang i une adresse §gale a PO + 1 quand i est inferieur 
pu egal a R, etant le reste de la division par I de la 
valeur du compteur ordinal . 

Selon un mode de realisation, les moyens de lecture 
comprennent des moyens pour reorganiser les codes de la 
suite de codes lue dans la memoire programme, 
conformement a 1 * algorithme suivant : [c'(j) =c(i), avec 
i = (j+R')modulo I], dans lequel "i" et "j" designent les 
rangs des codes avant et apres reorganisation, c(i) 
designe des codes de rang i dans leur agencement apres 
lecture dans la memoire, c f (j) designe des codes de rang 
j apres reorganisation, R' etant le reste de la division 
par I de la valeur que presentait le compteur ordinal au 
cours du cycle d'horloge precedent. 

Selon un mode de realisation, les moyens pour 
reorganiser sont agences pour appliquer aux codes de la 
suite de codes lue dans . la memoire programme une 
permutation circulaire comprenant un nombre de 
permutations circulaires elementaires egal a R ' ou a [I- 
R»] selon le sens dans lequel est realisee la permutation 
circulaire . 

Selon un mode de realisation, les permutations 
circulaires sont effectuees par un barillet a decalage 
recevant sur une entree de commande le parametre R ! . 

Avantageusement, les moyens de lecture comprennent 
des moyens pour f iltrer les codes n ■ appartenant pas a 
1 1 instruction a lire, au moyen de bits de parallelisme 
accompagnant les codes . 

Selon un mode de realisation, les codes filtres 
sont remplaces par des codes de non-operation. 

Selon un mode de realisation, les moyens de 
filtrage de codes sont agences pour executer l 1 algorithme 
suivant : [Pour j = 0, val(j=0) = "v», s(j=0) = c'(j=0) ; 



Pour j allant de 1 a I, val(j) = "v" si val(j-l) = "v" et 
si bit de parallelisme de C (j)="p ,, / sinon val(j-l) 
"/v" ; s(j) = c ! (j) si val(j) = "v" ; 

s(j) = NOP si val(j) = "/v" ] , dans lequel val(j) est un 
terme de validation associe a chaque code c'(j) de rang 
^, pouvant presenter deux valeurs "v" et "/v", s(j) 
designe des sorties de rang j des moyens de filtrage, 
correspondant a des entrees de meme rang recevant un code 
c' (j) , "NOP" est un code de non-operation. 

Selon un mode de realisation, les codes non filtres 
sont envoyes a des unites d 1 execution de type RISC 
agencees en parallele. 

La presente invention concerne egalement un procede 
de lecture d 1 instructions de taille variable pouvant 
comprendre jusqu'a N codes instruction elementaires, 
applicable a un processeur de traitement du signal, 
comprenant les etapes consistant a prevoir une memoire 
programme comprenant I bancs memoire en parallele 
adressables individuellement , I etant au moins egal a N, 
enregistrer les codes d'un programme dans la memoire 
programme de fagon entrelacee, a raison d'un code par 
banc et par adresse appliquee au banc, et au cours d'un 
cycle de lecture d'une instruction, lire dans les I bancs 
memoire une suite de codes comprenant le ou les codes de 
1 ' instruction a lire et pouvant egalement comprendre, 
quand le nombre de codes de 1 1 instruction lue est 
inferieur a I, des codes appartenant a une instruction 
suivante . 

Selon un mode de realisation, le procede comprend 
une etape consistant a appliquer aux bancs memoire des 
adresses individuelles generees a partir d'une valeur 
collective de compteur ordinal, qui est incrementee, 
avant le commencement d'un cycle de lecture d'une 
instruction, d'une valeur egale au nombre de codes que 
comprend 1 1 instruction precedente . 

Selon un mode de realisation, le procede comprend 
une etape consistant a appliquer a chacun des bancs 
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memoire une adresse de lecture individuelle egale a PO ou 
PO + 1, PO etant le quotient de la division par I de la 
valeur du compteur ordinal, un banc memoire de rang i 
recevant une adresse egale a PO quand i est strictement 
5 superieur a R, ou une * adresse egale a PO + 1 quand i est 
inferieur ou egal a R, R etant le reste de la division 
par I de la valeur du compteur ordinal. • 

Selon un mode de realisation, le procede comprend 
une etape de reorganisation des codes de la suite de 
10 codes lue dans la memoire programme, conformement a 
l'algorithme mentionne plus haut . 

Selon un mode de realisation, le procede comprend 
une etape de filtrage des codes lus n'appartenant pas a 
1 ' instruction a lire, au moyen de bits de parallelisme 
15 accompagnant les codes . 

Selon un mode de realisation, des codes filtres 
sont remplaces par des codes de non-operation. 

Selon un mode de realisation, les codes sont 
filtres conformement a l'algorithme mentionne plus haut. 
20 Selon un mode de realisation, les codes non filtres 

sont envoyes a des unites d' execution de type RISC 
agencees en parallele. 

Ces objets, caracteristiques et avantages ainsi que 
d'autres de la presente invention seront exposes plus en 
25 detail dans la description suivante d'un exemple de 
realisation d'un processeur selon 1' invention, faite a 
titre non limitatif en relation avec les figures jointes 
parmi lesquelles : 

- la figure 1 precedemment decrite represente sous forme 
30 de blocs 1 1 architecture d'un processeur VLIVJ classique, 

la figure 2 represente sous forme de blocs 
1 1 architecture d'un processeur selon 1' invention, 

les figures 3 et 4 representent des modes de 
realisation d' elements representes sous forme de blocs en 
35 figure 2. 

La figure 2 represente schematiquement 

1 1 architecture d'un processeur de traitement du signal 2 0 




selon 1' invention. Le processeur 20 comprend, comme le 
processeur classique de la figure 1, . une memoire 
programme PMEM1, une memoire de donnees DMEM, un registre 
d 1 instructions IR, un decodeur d ' instructions IDEC agence 
5 a la sortie du registre IR, une banque de registres 
RBANK, des unites d' execution, ici quatre unites EUO a 
EU3 , ainsi qu'un circuit BMC ( f, Built-In Self 
Test/Mapping/Conflicts") prevu pour lire ou ecrire des 
donnees dans la memoire de donnees DMEM ou dans la banque 

10 de registres RBANK et assurant diverses autres fonctions 
comme 1 ' autotest des memoires ("Built-in Self Test" ou 
"BIST") et la gestion des conflits d'adresses. Le 
registre d 1 instructions IR comprend quatre registres IRO 
a IR3 en parallele, prevus pour recevoir a chaque cycle 

15 de lecture d'une instruction (cycle "fetch") quatre codes 
instruction c'(0) a c'(3) delivres par la memoire 
programme PMEM1 . Le decodeur d 1 instructions IDEC assure 
le decodage des codes c'(0)-c f (3) ainsi que la 
distribution des operandes en direction des unites 

20 d' execution concernees . Ces elements sont en soi 
classiques et constituent le cceur du processeur, 
represents schematiquement sous la forme d'un bloc. 

Le processeur 20 selon 1 1 invention se distingue 
d ! un processeur classique par le fait que la memoire 

25 programme PMEM1 est constitute par plusieurs bancs 
memoire agences en parallele, ici quatre bancs MO, Ml, 
M2, M3 adressables individuellement et recevant 
respect ivement des adresses aO, al, a2 , a3 . Dans ce qui 
suit, on designera par "I" le nombre de bancs memoire 

30 adressables individuellement presents dans un processeur 
selon 1' invention, et par "N" le nombre maximal de codes 
instruction pouvant etre contenus dans une instruction 
large (paquet) , I devant au moins etre egal a N. Ici, I 
est egal a N qui est egal a 4 puisque le processeur 

35 comprend quatre unites d 1 execution . 

Selon 1' invention, les codes instruction (syllabes) 
d'un programme sont enregistres dans la memoire PMEM1 de 




fagon entrelacee, de telle sorte que deux codes se 
succedant dans le programme soient agences dans deux 
bancs memoire contigus de rangs croissants, avec la meme 
adresse a ± dans chaque banc. Lorsqu 1 un code est 
5 enregistre dans le dernier banc memoire M3 , a une adresse 
a 3 = "x", le code suivant est enregistre dans le banc 
memoire MO a 1' adresse aO = "x+1" ,. et les codes suivants 
sont enregistres dans les bancs Ml, M2 , M3 aux adresses 
al - a2 = a3 = "x+l" , etc.. 
10 Pour fixer les idees, considerons que la sequence 

de programme suivante, deja decrite au preambule, est 
stockee dans la memoire virtuelle PMEM1 : 

INST1 = CO 
15 INST2 = cl C2 

INST3 = c3 c4 c5 c6 
INST4 = c7 c8 c9 

A la difference d'un processeur classique, les codes 
20 constituant les instructions larges INST1 a INST4 sont 
enregistres dans les bancs memoire les uns apres les 
autres sans injection de codes de non-operation NOP, 
comme cela apparait dans le tableau 2 ci-apres, la 
separation des instructions etant assuree exclusivement 
25 par les bits de parallelisme. 



Tableau 2 



Adresses 


Banc MO 


Banc Ml 


Banc M2 


Banc M3 


X 


/p c0 


/p cl 


p c2 


/p c3 


x+l 


p c4 


p c5 


p c6 


/p c7 


x+2 


p c8 


p c9 


/p. . . 





Notons ici que les bits de parallelisme sont 
30 representes ici comme des elements exterieurs aux codes 
cO a c9 pour faciliter la comprehension de 1' invention. 
En pratique, les bits de parallelisme font partie 
integrante des codes stockes en memoire et sont elimines 
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au moment de 1' execution des codes. Par exemple, les 
codes c0-c9 comprennent 16 bits parmi lesquels un bit est 
utilise en tant que bit de parallelisme . 

Ainsi, avantageusement , le processeur selon 
5 l 1 invention regoit des programmes compactes ne comportant 
pas de codes NOP. II en resulte une . diminution 
substantielle de 1 1 encombrement de 1 ' espace memoire 
entrainant une baisse de la . surface necessaire au 
stockage du programme et une diminution de la 

10 consommation . 

On va maintenant decrire des moyens de lecture de 
la memoire PMEM1, prevus pour "desentrelacer " les codes 
instruction afin d'en extraire des instructions larges, 
ou "paquets" , comprenant plusieurs codes ou "syllabes" 

15 destines a etre executes simultanement . 

Selon 1' invention, ces moyens de lecture 
comprennent essentiellement un circuit de gestion 
d'adresses IAC, un circuit de permutation de codes PCC et 
un * circuit de selection de codes CSC, et consistent 

20 egalement dans une gestion particuliere du compteur 
ordinal PC ("program counter") du processeur 20, qui sera 
tout d'abord decrite. 

Le compteur ordinal PC est increments de fagon 
classique a chaque cycle d'horloge, par exemple au moyen 

25 d'un additionneur ADD1 recevant sur une entree la valeur 
courante du compteur ordinal et sur une autre entree un 
increment n, la sortie de 1 ■ additionneur etant appliquee 
a un tampon LT1 pilote par le signal d'horloge H. Selon 
1' invention, le compteur ordinal PC est increments d'une 

30 valeur n qui n'est pas constante comme dans 1 1 art 
anterieur. L ' increment n est egal au nombre de codes 
instruction executables que comprend 1 * instruction 
precedente et est ici delivre par le circuit CSC decrit 
plus loin. 

35 Cette regie d ' incrementation du compteur ordinal 

concerne bien entendu la lecture sequentielle des 
instructions d'un programme et ne s' applique pas lors de 
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1 1 execution d ' instructions speciales comme des 
instructions de saut ou de branchement , pour lesquelles 
1 1 increment de saut ou la valeur de branchement est 
impose par le programme . 

Le circuit de gestion d'adresses IAC mentionne plus 
haut assure le calcul des adresses individuelles a0-a3 
appliquees aux bancs memoire a partir de la valeur 
courante du compteur ordinal PC, increment ee de la 
maniere qui vient d'etre decrite. Plus particulierement , 
le circuit IAC calcule les adresses a0-a3 en appliquant 
l'algorithme Al suivant : 

Al : Pour i allant de 0 a 1-1, 

3l ± = PO + 1 si i < R 
ai = PO si i > R 

dans lequel : 

1) "i" est 1 1 indice designant le rang des bancs memoire 
M0-M3 et le rang des adresses correspondantes a0-a3, 

2) PO est le quotient de la division par I du compteur 
ordinal PC, soit : 

PO = Quotient (PC/ I) 
soit ici, I etant egal a 4 : 

PO = Quotient (PC/4) 

3) R est le reste de la division par I du compteur 
ordinal PC, soit : 

R = PC - PO = PC modulo I, 
soit ici, I etant egal a 4 : 




R = PC modulo 4 

Des exemples de mise en oeuvre de cet algorithme, ainsi 
qu'un exemple de realisation du circuit IAC seront 
5 decrits plus loin. 

Le circuit de permutation de codes PCC mentionne 
plus haut est relie a la sortie de la memoire programme 
PN1EM1 et comprend des entrees eO a e3 connectees 
respectivement aux sorties des bancs memoire MO a M3 et 

10 recevant respectivement des codes c(0) / c(l), c(2), c(3) 
lus dans la nvemoire programme. Le circuit PCC comprend 
egalement quatre sorties sO, si, s2, s3 delivrant 
respectivement des codes c' (0) , c*(l), c'(2), c'(3). Les 
codes delivres sont egaux aux codes regus en entree mais 

15 sont reorganises par le circuit PCC selon 1" algorithme A2 
suivant : 

A2 : Pour i allant de 0 a N-l 

et j allant de 0 a N-l 
20 c'(j)=c(i), avec i = (j + R 1 ) modulo I 

dans lequel : 

1) "i" est 1.' indice mentionne plus haut, designant ici le 
25 rang des codes d'entree c(0)-c(3) delivres par les bancs 

memoire M0-M3, 

2) "j" est un indice designant le rang des codes de 
sortie c 1 (0) -c ■ (3) , 

30 

3) R' est le reste de la division par I du compteur 
ordinal "PC, calcule au cycle d'horloge precedent. 

Comme represents en figure 2, le circuit PCC peut 
35 etre realise simplement au moyen d'un barillet a decalage 
("Barrel Shifter") d'un type connu en soi . L 1 algorithme 
A2 est mis en oeuvre en appliquant sur 1 ' entree de 
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commande du barillet, par 1 ' intermediaire d'un tampon 
LT2 , le parametre R calcule et delivre par le circuit 
IAC. Le tampon LT2 etant pilote par le signal d'horloge, 
le parametre R qui est applique au barillet apres chaque 
front du signal d'horloge est decale d'un cycle d'horloge 
relativement au parametre R du cycle en cours .et est done 
egal au parametre R' mentionne plus haut . Le barillet PCC 
est agence pour decaler ses sorties relativement a ses 
entrees par permutation circulaire a gauche (sens des 
poids forts vers les poids faibles) , en effectuant un 
nombre de decalages a gauche egal a R' . Dans une variante 
de realisation, le barillet re<?oit sur son entree de 
commande le complement de R' a I, soit la valeur [I-R» ] , 
et est agence pour decaler ses sorties relativement a ses 
entrees par permutation circulaire a droite (sens des 
poids faibles vers les poids forts) en effectuant un 
nombre de decalages a droite egal a [I-R 1 ] . 

Le circuit de selection de codes CSC mentionne plus 
haut est connecte en entree a la sortie du circuit PCC et 
comprend des entrees eO a e3 recevant respectivement les 
codes c ! (0) a c' (3) . Le circuit CSC comprend egalement 
quatre sorties sO a s3 qui recopient le code regu sur 
1' entree de meme rang dans des conditions prevues par 
l'algorithme A3 suivant : 

A3 : Pour j = 0 

val (j=0) = "v" 
s(j=0) = C (j=0) 
Pour j allant de 1 a I 
val(j) = "v" 
si val ( j -1) = »v" 
et si bit de parallelisme de c , (j)= ,, p n 
sinon val(j-l) = n /v" 
s(j) = c'(j) si val (j) = "v", 
s(j) = NOP si val(j) = »/v" 
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dans lequel val(j) est un terme de validation recursif de 
type "daisy chain", associe a chaque sortie s(j) de rang 
j, pouvant presenter deux valeurs "v" et "/v" , par 
exemple "1" et "0" . Pour les sorties de rang "j" allant 
de 1 a I , ce terme permet de determiner si une sortie 
s(j) doit recopier le code c' (j) regu sur 1' entree de 
rang correspondant ou doit au contraire delivrer un code 
NOP . Ce choix est fonction de . la valeur du terme de 
validation val(j), qui est elle-meme fonction de la 
valeur du terme de validation precedent val(j-l) et de la 
valeur "p" ou "/p" r par exemple "1" ou "0", du bit de 
parallelisme present dans le code c' (j) . 

En d'autres termes, en attribuant par convention la 
valeur 1 a "p" et "v" et la valeur "0" a !, /p" et "/v" , la 
sortie sO recopie le code c ! (0) regu sur 1 ' entree eO et 
chacune des autres sorties s(j) recopie le code c'(j) 
regu sur 1 1 entree correspondante e(j) si le code c'(j) 
comprend un bit de parallelisme egal a "1" et si le bit 
de validation val(j-l) de la sortie de rang precedent est 
aussi egal a "1". Quand le bit de parallelisme d'un code 
c'(j) est egal a 11 0" , la sortie correspondante s(j) et 
toutes les sorties suivantes delivrent un code NOP. 

Le systeme de lecture de la memoire programme PMEM1 
fonctionne ainsi comme suit : 

Etape El : au cours d'un premier cycle d'horloge, 
le circuit IAC applique aux bancs memoire M0-M3 des 
adresses a0-a3 assurant la lecture de quatre codes 
instruction a(0)-a(3), qui se suivent dans la memoire 
PMEMl selon 1 ' entrelacement decrit plus haut ; 

. Etape E2-1 : au cours du cycle d'horloge suivant, 
un signal de lecture READ est applique aux bancs memoire 
et les codes sont lus dans un ordre qui peut ne pas 
correspondre, en raison de leur entrelacement, a leur 
rang effectif prevu dans le programme. lis sont remis 
dans 1' ordre par le circuit PCC en application de 
l'algorithme A2 , au moyen du parametre R 1 calcule au 




cycle d'horloge precedent (c'est-a-dire au moment de 
1 1 elaboration des adresses a0-a3) ; 

Etape E2-2 : au cours du meme cycle d'horloge, le 
circuit de selection CSC identif ie les codes qui ne 
5 correspondent pas a 1** instruction a executer, grace a 
leur bit de parallelisme "/p" et les remplace par des 
codes de non-operation NOP ; 

Etape E2-3 : au cours du meme cycle d'horloge le 
registre d ' instructions IRO regoit le code c'(0) et les 
10 registres IR1-IR3 regoivent les codes filtres (NOP) ou 
non filtres selon la selection faite par le circuit CSC ; 

Etape E3 et suivantes : les codes non filtres sont 
decodes par le decodeur IDEC et executes par les unites 
EU0-EU4. 

15 Ainsi, la lecture d'une instruction large est faite 

en deux cycles d'horloge comme dans 1 ' art anterieur, et 
comprend un cycle pour 1 ' elaboration des adresses a0-a3 
et un cycle pour la lecture des codes. Les codes lus sont 
reorganises et filtres au cours du cycle de lecture, 

20 1' operation etant " transparent e" pour le fonctionnement 
de 1' ensemble. Ces etapes sont effectuees avec 
chevauchement, selon les regies classiques de 
fonctionnement pipeline, les registres pipeline n'ayant 
pas ete decrits et representes dans un souci de 

25 simplicity. 

Le tableau 3 figurant en Annexe fait partie 
integrante de la description et illustre le 
fonctionnement du processeur pour la lecture des 
instructions INST1 a INST4 decrites plus haut . Les 

30 parametres PC, R, R 1 et P0 intervenant dans I 1 execution 
des algorithmes sont mentionnes dans les premieres 
colonnes. On considere dans cet exemple que les codes des 
instructions INST1 a INST3 sont stockes dans la memoire 
programme PMEM1 a partir de l'adresse 0 et que le 

35 compteur ordinal est egal a 0 au commencement du 
processus de lecture. Les colonnes a0-a3 donnent les 
valeurs des adresses calculees a partir de la valeur 
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courante du compteur ordinal PC. Les colonnes c(0)-c(3) 
donnent les valeurs des codes lus dans la memoire dans 
l ! ordre dans lequel ils se trouvent . Les colonnes c ! (0) 
c ! (3) donnent les valeurs des codes apres reorganisation 
par le circuit PCC.' Les quatre ' dernieres colonnes 
c' (O)-c' (3) donnent les valeurs des codes apres filtrage 
dans le circuit CSC. 

En observant les quatre dernieres colonnes du 
tableau 3, il apparait que les codes qui y figurent sont 
equivalents, en agencement et en valeur, aux codes qui se 
trouvaient dans la memoire du processeur classique decrit 
au preambule (voir le tableau 1 au preambule) . Ainsi, le 
systeme de lecture selon 1' invention reconstitue les 
codes NOP qui etaient, dans 1 ' art anterieur, enregistres 
dans la memoire programme. 

De fagon generale, la realisation des circuits IAC 
et CSC est a la portee de 1 1 homme de l'art, notamment 
grace aux techniques de conception automatique de 
circuits logiqu.es k partir du langage VHDL. Les 
algorithmes Al et A3 mentionnes plus haut sont exprimes 
en langage VHDL et les circuits IAC et CSC sont generes 
automat iquement par un compilateur de langage VHDL, sous 
forme de circuits a logique cablee. On decrira toutefois 
a titre non limitatif, en relation avec les figures 3 et 
4/ d es exemples de realisation des circuits IAC et CSC 
dans le cas ou les parametres I et N sont egaux a 4 . 

Sur la figure 3, le circuit IAC regoit en entree un 
compteur ordinal PC code sur 32 bits. Le resultat R est 
obtenu de fagon simple en separant les deux fils de poids 
faible de la ligne physique vehiculant le compteur 
ordinal PC, R etant ainsi egal aux deux bits de poids 
faible du compteur ordinal. De meme, PO est egal aux 3 0 
bits de poids fort du compteur ordinal et est obtenu en 
separant les 30 fils de poids fort. Le parametre PO +1 
est calcule par un additionneur recevant les valeurs PO 
et "1" en entree. Les adresses a0-a3 sont delivrees par 
des multiplexeurs MXA1-MXA3 recevant en entree les 




parametres PO et PO+1. Ces multiplexeurs sont pilotes par 
des comparateurs CMP0-CMP3 recevant sur une premiere 
entree 1 1 indice "i" et sur une seconde entree le 
parametre R. 

5 Sur la figure 4/ le circuit CSC est realise au 

moyen de quatre multiplexeurs MXB0-MXB3 recevant chacun 
un code c'(j) sur une premiere entree et un code NOP sur 
une deuxieme entree. Chaque multiplexeur est pilote par 
un signal de validation valO, vail, val2 , val3 dont la 

10 valeur determine la selection du code c' (j) ou du code 
NOP en sortie du multiplexeur. Les codes de validation 
sont generes par une cascade de portes ET formant une 
chaine de type "Daisy Chain", chaque porte ET recevant en 
entree le signal de validation du code precedent et le 

15 bit de parallelisme du code regu par le multiplexeur 
auquel elle est rattachee. Ainsi, la presence d'un bit de 
parallelisme a 0 dans un code c' (j) entraine le 
basculement de tous les signaux de validation suivants, 
de sorte que le code concerne et tous les codes suivants 

20 sont remplaces par des codes NOP. Le signal de validation 
valO du premier code c'(0) est genere par une porte 
inverseuse car le bit de parallelisme du premier code est 
en principe tou jours egal a 0 ("/p"). Le multiplexeur 
MUXBO et le signal de selection valO du premier code 

25 c ! (0) sont en principe inutiles puisque le premier code 
c'(0) n'est, en principe, jamais filtre, une instruction 
large comprenant au moins un code instruction. Toutefois, 
la prevision de ce multiplexeur permet de detecter un 
eventuel defaut de lecture de la memoire programme ou un 

30 defaut de f onctionnement du circuit a decalage PCC, qui 
apparait quand le bit de parallelisme du premier code 
c' (0) est different de 0. Dans ce cas, le signal de 
validation valO peut etre utilise en tant que signal 
d'erreur ERR. 

35 Le circuit CSC comprend egalement un additionneur 

ADD2 recevant en entree les quatre signaux de validation 
valO a val3 , dont la sortie delivre la valeur n qui est 



19 



appliquee a 1 * additionneur ADD1 pour 1 ' incrementation du 
compteur ordinal (fig. 2). L'increment n est ainsi egal 
au nombre de signaux de validation egaux a 1, et 
represente par consequent le nombre de codes instruction 
5 qui n'ont pas ete filtres, c'est-a-dire le nombre 
effectif de codes que comprend 1 1 instruction large qui 
vient d'etre lue . 

La presente invention est bien entendu susceptible 
de diverses variantes et modes de realisation. Notamment, 

10 il est envisageable en pratique d' incorporer le circuit 
de filtrage CSC dans le decodeur d ' instructions IDEC. En 
effet, la fonction de ce circuit est de garantir que des 
codes n ' appartenant pas a une instruction a executer ne 
seront pas envoyes aux unites d'execution EU0-EU3. Le 

15 filtrage des codes indesirables peut ainsi etre fait en 
aval du registre d' instructions IDEC, par le decodeur 
IDEC lui-meme. De fagon generale, 1 1 agencement du circuit 
CSC dans les etages pipeline est dicte par les 
contraintes tempcprelles ("timing") concernant l'acces a 

20 la memoire PMEM1 et par le temps de decodage dans de 
decodeur IDEC, et releve des competences de 1 ' homme de 
l'art. 

II apparaitra clairement a l'homme de l'art que la 
. presente invention offre un large degre de liberte dans 

25 la conception d'un processeur de type VLIW. II est 
notamment possible, comme on l'a indique plus haut, de 
prevoir un processeur ayant un nombre I de bancs memoire 
et un nombre N d' unites d 1 execution qui sont differents. 
II est egalement possible de choisir de fagon dynamique 

30 le nombre N d' unites d 1 execution actives, selon 
1 ' application visee, en inhibant certaines unites 
d' execution pour limiter la consommation de courant . 
Cette inhibition de certaines unites d ! execution peut 
etre prevue programmable. L ' architecture d'un processeur 

35 selon 1 1 invention n'etant pas " figee" comme celle d'un 
processeur VLIW classique, grace a la suppression de 
1' obligation de lire en bloc N codes instruction et de 



1' obligation qui en resulte d'injecter des codes NOP dans 
un programme quand une instruction contient moins de N 
codes, la presente invention ouvre un large domaine de 
conception d'un nouveau type de processeurs conciliant 
des exigences de f aible consommation, de f aible 
encombrement en termes de surface de silicium, et offrant 
de hautes performances grace a un parallelisme eleve. 
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REVEND I CAT I ONS 

1. Processeur (20) de traitement du signal prevu 
pour executer des instructions (11-14) de taille variable 
pouvant comprendre ' jusqu'a N codes instruction 
elementaires (c(0)-c(3)), caracterise en ce qu'il 
comprend : 

une memoire programme (PMEM1) comprenant 1 bancs 
memoire (M0-M3) en parallele adressables 

individuellement , I etant au moins egal a N, dans 
lesquels les codes (c0-c9) d'un programme sont 
enregistres de fagon entrelacee a raison d'un code par 
banc et par adresse appliquee au banc, 

- des moyens de lecture (IAC, PCC, CSC) de la memoire 
programme agenc.es pour lire un code dans chacun des I 
bancs memoire au cours d'un cycle de lecture d'une 
instruction, 

un cycle de lecture d'une instruction (II) dans la 
memoire programme comprenant la lecture d'une suite de 
codes (c0-c3) comprenant le ou les codes (cO) de 
1 1 instruction a lire (II) et pouvant egalement 
comprendre, quand le nombre de codes de 1 1 instruction lue 
est inferieur a I, des codes (cl-c3) appartenant a une 
instruction suivante. 

2 . Processeur selon la revendication 1 , caracterise 
en ce que les moyens de lecture comprennent des moyens 
(IAC) pour appliquer aux bancs memoire des adresses 
individuelles (a0-a3) generees a partir d'une valeur 
collective (PC) de compteur ordinal, qui est incrementee, 
avant le commencement d'un cycle de lecture d'une 
instruction, d'une valeur (n) egale au nombre de codes 
que comprend 1 ■ instruction precedente . 

3. Processeur selon la revendication 2, caracterise 
en ce que les moyens pour appliquer des adresses (IAC) 
sont agences pour appliquer a chacun des bancs memoire 




# 
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une adresse de lecture individuelle egale a PO ou PO + 1, 
PO etant le quotient de la division par I de la valeur du 
compteur ordinal. 



en ce que les moyens pour appliquer des adresses (IAC) 
sont agences pour : 

- appliquer a un banc memoire de rang i une adresse egale 
a PO quand i est strictement superieur a R, ou 
10 - appliquer a un banc memoire de rang i une adresse egale 
a PO+1 quand i est inferieur ou egal a R, 

R etant le reste de la division par I de la valeur du 
compteur ordinal . 

15 5. Processeur selon I'une des revendications la 4, 

caracterise en ce que les moyens de lecture comprennent 
des moyens (PCC) pour reorganiser les codes de la suite 
de codes lue dans la memoire programme, conformement a 
1 ' algorithme. suivant : 

20 



dans lequel "i" et "j" designent les rangs des codes 
25 avant et apres reorganisation, c(i) designe des codes de 
rang i dans leur agencement apres lecture dans la 
memoire, c'(j) designe des codes de rang j apres 
reorganisation, R' etant le reste de la division par I de 
la valeur que presentait le compteur ordinal au cours du 
30 cycle d'horloge precedent. 

6 . Processeur selon la revendication 5, caracterise 
en ce que les moyens pour reorganiser (PCC) sont agences 
pour appliquer aux codes de la suite de codes lue dans la 
35 memoire programme une permutation circulaire comprenant 
un nombre de permutations circulaires elementaires egal a 



4 . 



Processeur selon la revendication 3, caracterise 



[C (j) = c(i) 
avec i = (j+R') modulo I] 



r 1 ou a [I-R'] selon le sens dans lequel est realisee la 
permutation circulaire. 



7. Processeur selon la revendication 6, caracterise 
en ce que les permutations circulaires sont effectuees 
par un barillet a decalage recevant sur une entree de 
commande le parametre R' . 

8. Processeur selon l'une des revendications 1 a 7, 
caracterise en ce que les moyens de lecture comprennent 
des moyens (CSC) pour f iltrer les codes (cl-c3) 
n' appartenant pas a 1 » instruction a lire (II) , au moyen 
de bits de parallelisme ("p", *7p") accompagnant les 
codes . 

9. Processeur selon la revendication 8, caracterise 
en ce que les codes filtres sont remplaces par des codes 
de non-operation (NOP) . 

10. Processeur selon la revendication 9, dans 
lequel les moyens de filtrage de codes (CSC) sont agences 
pour executer l'algorithme suivant : 

[Pour j = 0, 
val(j=0) = "v" 
s ( j=0) = c ■ ( j=0) ; 
Pour j allant de 1 a I 
val(j) = "v" si : 
val(j-l) = "v" et si bit de parallelisme de C (j)="p" / 

sinon val(j-l) - "/v" ; 
s(j) = c'(j) si val(j) = "v" ; 
s(j) = NOP si val(j) - "/v" ] 

dans lequel val(j) est un terme de validation associe a 
chaque code c'(j) de rang j, pouvant presenter deux 
valeurs "v" et "/v", s(j) designe des sorties de rang j 
des moyens de filtrage, correspondant a des entrees de 
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meme rang recevant un code c' (j), "NOP" est un code de 
non - ope r a t i on . 

11. Processeur selon l'une des revendications 8 a 
5 10, caracterise en ce* que les codes non filtres sont 

envoyes a des unites d 1 execution de type RISC (EU0-EU3) 
agencees en parallele. 

12. Procede de lecture d ' instructions (11-14) de 
10 taille variable pouvant comprendre jusqu'a N codes 

instruction elementaires (c(0)-c(3)), applicable a un 
processeur de traitement du signal (20) , caracterise en 
ce qu'il comprend les etapes consistant a : 

prevoir une memoire programme (PMEM1) comprenant I 

15 bancs memoire (M0-M3) en parallele adressables 
individuellement , I etant au moins egal a N, 
- enregistrer les codes (c0-c9) d'un programme dans la 
memoire programme (PMEM1) de fagon entrelacee, a raison 
d'un code par banc et par adresse appliquee au banc, et 

20 - au cours d'un cycle de lecture d'une instruction, lire 
dans les I bancs memoire (M0-M3) une suite de codes (cO- 
c3) comprenant le ou les codes (cO) de 1 ' instruction a 
lire (II) et pouvant egalement comprendre, quand le 
nombre de codes de 1 ' instruction lue est inferieur a I, 

25 des codes (cl-c3) appartenant a une instruction suivante. 

13. Procede selon la revendication 12, comprenant 
une etape consistant a appliquer aux bancs memoire des 
adresses individuelles (a0-a3) generees a partir d'une 

30 valeur collective (PC) de compteur ordinal, qui est 

incrementee, avant le commencement d'un cycle de lecture 

d'une instruction, d'une valeur (n) egale au nombre de 

codes que comprend 1 ' instruction precedente . 

35 14. Procede selon la revendication 13, comprenant 

une etape consistant a appliquer a chacun des bancs 
memoire une adresse de lecture individuelle egale a P0 ou 
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PO + 1, PO etant le quotient de la division par I de la 
valeur du. compteur ordinal, un banc memoire de rang i 
recevant une adresse egale a PO quand i est strictement 
superieur a R, ou une adresse egale a PO + 1 quand i est 
inf erieur ou egal a r/ R etant le reste de la division 
par I de la valeur du compteur ordinal. 

15. Procede selon I'une des revendications 12 a 14, 
caracterise en ce qu'il comprend une etape de 
reorganisation des codes de la suite de codes lue dans la 
memoire programme , conf ormement a 1 ' algorithme suivant : 

[c' (j) = c(i) 
avec i = (j+R*) modulo I] 

dans lequel "i" et "j" designent les rangs des codes 
avant et apres reorganisation, c(i) designe des codes de 
rang i dans leur agencement apres lecture dans la 
memoire, C (j) designe des codes de rang j apres 
reorganisation, R' etant le reste de la division par I de 
la valeur que presentait le compteur ordinal au cours du 
cycle d'horloge precedent. 

16. Procede selon l'une des revendications 12 a 15, 
caracterise en ce qu'il comprend une etape de filtrage 
des codes lus (cl-c3) n • appartenant pas a 1 ' instruction a 
lire (II), au moyen de bits de parallelisme ("p" , "/p") 
accompagnant les codes . 

17 . Procede selon la revendication 16 , caracterise 
en ce que des codes filtres sont remplaces par des codes 
de non-operation (NOP) . 

18 . Procede selon la revendication 17 , dans lequel 
les codes sont filtres conf ormement a 1' algorithme 
suivant : 
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[Pour j = 0, 
val(j=0) = "v" 
s ( j=0) = C ( j=0) ; 
Pour j allant de 1 a I 
5 vai(j) = "v" si : 

val(j-l) = "v" et si bit de parallelisme de c'(j)="p", 

sinon val(j-l) = "/v" ; 
s(j) = C (j) si val (j) = "v" ; 
s(j) = NOP si val(j) = "/v" ] 

10 

dans lequel val(j) est un terme de validation associe a 
chaque code c ! (j) de rang j, pouvant presenter deux 
valeurs "v" et "/v" , s(j) designe des sorties de rang j 
des moyens de filtrage, correspondant a des entrees de 
15 meme rang recevant un code c'dj), "NOP" est un code de 
non-operation. 

19. Procede selon l'une des revendications 16 a 18, 
characterise en ce que les codes non filtres sont envoyes 
20 a des unites d' execution de type RISC (EU0-EU3) agencees 
en parallele. 
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